☰
16.2.1 CLIP(Contrastive Language-Image Pre-training)과 그 변형들: SigLIP, ALIGN
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception)
/
16.2 시각-언어 정렬(Vision-Language Alignment)의 핵심 원리
/
16.2.1 CLIP(Contrastive Language-Image Pre-training)과 그 변형들: SigLIP, ALIGN
16.2.1 CLIP(Contrastive Language-Image Pre-training)과 그 변형들: SigLIP, ALIGN